智能论文笔记

Knowledge Graph - Deep Learning: A Case Study in Question Answering in Aviation Safety Domain

Ankush Agarwal , Raj Gite , Shreya Laddha , Pushpak Bhattacharyya , Satyanarayan Kar , Asif Ekbal , Prabhjit Thind , Rajesh Zele , Ravi Shankar

分类：自然语言处理 | 人工智能 | 机器学习

2022-05-31

在商业航空域中，有大量文件，例如事故报告（NTSB，ASRS）和监管指令（ADS）。有必要有效地访问这些多样化的存储库，以便在航空业中的服务需求，例如维护，合规性和安全性。在本文中，我们提出了一个基于深度学习的知识图（kg）基于深度学习（DL）的问题答案（QA）航空安全系统。我们从飞机事故报告中构建了知识图，并向研究人员社区贡献了这一资源。该资源的功效由上述质量保证系统测试和证明。根据上述文档构建的自然语言查询将转换为SPARQL（RDF图数据库的接口语言）查询并回答。在DL方面，我们有两个不同的质量检查模型：（i）BERT QA，它是通道检索（基于句子的）和问题答案（基于BERT）的管道，以及（ii）最近发布的GPT-3。我们根据事故报告创建的一系列查询评估系统。我们组合的QA系统在GPT-3上的准确性增长了9.3％，比Bert QA增加了40.3％。因此，我们推断出KG-DL的性能比单一表现更好。

translated by 谷歌翻译

Federated Learning with Client-Exclusive Classes

Jiayun Zhang , Xiyuan Zhang , Xinyang Zhang , Dezhi Hong , Rajesh K. Gupta , Jingbo Shang

分类：机器学习

2023-01-01

Existing federated classification algorithms typically assume the local annotations at every client cover the same set of classes. In this paper, we aim to lift such an assumption and focus on a more general yet practical non-IID setting where every client can work on non-identical and even disjoint sets of classes (i.e., client-exclusive classes), and the clients have a common goal which is to build a global classification model to identify the union of these classes. Such heterogeneity in client class sets poses a new challenge: how to ensure different clients are operating in the same latent space so as to avoid the drift after aggregation? We observe that the classes can be described in natural languages (i.e., class names) and these names are typically safe to share with all parties. Thus, we formulate the classification problem as a matching process between data representations and class representations and break the classification model into a data encoder and a label encoder. We leverage the natural-language class names as the common ground to anchor the class representations in the label encoder. In each iteration, the label encoder updates the class representations and regulates the data representations through matching. We further use the updated class representations at each round to annotate data samples for locally-unaware classes according to similarity and distill knowledge to local models. Extensive experiments on four real-world datasets show that the proposed method can outperform various classical and state-of-the-art federated learning methods designed for learning with non-IID data.

translated by 谷歌翻译

Stars: Tera-Scale Graph Building for Clustering and Graph Learning

CJ Carey , Jonathan Halcrow , Rajesh Jayaram , Vahab Mirrokni , Warren Schudy , Peilin Zhong

分类：机器学习

2022-12-05

A fundamental procedure in the analysis of massive datasets is the construction of similarity graphs. Such graphs play a key role for many downstream tasks, including clustering, classification, graph learning, and nearest neighbor search. For these tasks, it is critical to build graphs which are sparse yet still representative of the underlying data. The benefits of sparsity are twofold: firstly, constructing dense graphs is infeasible in practice for large datasets, and secondly, the runtime of downstream tasks is directly influenced by the sparsity of the similarity graph. In this work, we present $\textit{Stars}$: a highly scalable method for building extremely sparse graphs via two-hop spanners, which are graphs where similar points are connected by a path of length at most two. Stars can construct two-hop spanners with significantly fewer similarity comparisons, which are a major bottleneck for learning based models where comparisons are expensive to evaluate. Theoretically, we demonstrate that Stars builds a graph in nearly-linear time, where approximate nearest neighbors are contained within two-hop neighborhoods. In practice, we have deployed Stars for multiple data sets allowing for graph building at the $\textit{Tera-Scale}$, i.e., for graphs with tens of trillions of edges. We evaluate the performance of Stars for clustering and graph learning, and demonstrate 10~1000-fold improvements in pairwise similarity comparisons compared to different baselines, and 2~10-fold improvement in running time without quality loss.

translated by 谷歌翻译

UNav: An Infrastructure-Independent Vision-Based Navigation System for People with Blindness and Low vision

Anbang Yang , Mahya Beheshti , Todd E Hudson , Rajesh Vedanthan , Wachara Riewpaiboon , Pattanasak Mongkolwat , Chen Feng , John-Ross Rizzo

分类：计算机视觉

2022-09-22

现在，基于视觉的本地化方法为来自机器人技术到辅助技术的无数用例提供了新出现的导航管道。与基于传感器的解决方案相比，基于视觉的定位不需要预安装的传感器基础架构，这是昂贵，耗时和/或通常不可行的。本文中，我们为特定用例提出了一个基于视觉的本地化管道：针对失明和低视力的最终用户的导航支持。给定最终用户在移动应用程序上拍摄的查询图像，该管道利用视觉位置识别（VPR）算法在目标空间的参考图像数据库中找到相似的图像。这些相似图像的地理位置用于采用加权平均方法来估计最终用户的位置和透视N点（PNP）算法的下游任务中，以估计最终用户的方向。此外，该系统实现了Dijkstra的算法，以根据包括Trip Origin和目的地的可通航地图计算最短路径。用于本地化和导航的层压映射是使用定制的图形用户界面构建的，该图形用户界面投影了3D重建的稀疏映射，从一系列图像构建到相应的先验2D楼平面图。用于地图构造的顺序图像可以在预映射步骤中收集，也可以通过公共数据库/公民科学清除。端到端系统可以使用带有自定义移动应用程序的相机安装在任何可互联网的设备上。出于评估目的，在复杂的医院环境中测试了映射和定位。评估结果表明，我们的系统可以以少于1米的平均误差来实现本地化，而无需了解摄像机的固有参数，例如焦距。

translated by 谷歌翻译

Comparative analysis of real bugs in open-source Machine Learning projects -- A Registered Report

Tuan Dung Lai , Anj Simmons , Scott Barnett , Jean-Guy Schneider , Rajesh Vasa

分类：人工智能

2022-09-20

背景：机器学习（ML）系统依靠数据来做出预测，与传统软件系统（例如数据处理管道，服务管道和模型培训）相比，该系统具有许多添加的组件。现有关于软件维护的研究研究了针对不同类型的问题（例如绩效和安全问题）的问题报告需求和解决过程。但是，ML系统具有特定的故障类别，报告ML问题需要特定于域的信息。由于ML和传统软件工程系统之间的特征不同，我们不知道报告需求在多大程度上不同，并且这些差异在多大程度上影响了问题解决过程。目的：我们的目标是调查ML和非ML问题之间分辨率时间的分布以及某些ML问题的分配时间是否存在差异。我们进一步研究了ML问题和非ML问题的修复大小。方法：我们在GitHub的最新活动应用ML项目中提取问题报告，提取请求和代码文件，并使用自动方法过滤ML和非ML问题。我们使用已知的深度学习错误分类法手动标记这些问题。我们测量了受控样本上ML和非ML问题的解决方案的分辨率时间和大小，并比较每个类别的分布。

translated by 谷歌翻译

A Mosquito is Worth 16x16 Larvae: Evaluation of Deep Learning Architectures for Mosquito Larvae Classification

Aswin Surya , David B. Peral , Austin VanLoon , Akhila Rajesh

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-16

蚊子传播的疾病（MBD），例如登革热病毒，基孔肯雅病毒和西尼罗河病毒，每年在全球造成超过100万人死亡。由于许多这样的疾病都被伊蚊和库氏蚊子传播，因此跟踪这些幼虫对于缓解MBD的传播至关重要。即使公民科学成长并获得了较大的蚊子图像数据集，蚊子图像的手动注释变得越来越耗时且效率低下。先前的研究使用计算机视觉识别蚊子物种，卷积神经网络（CNN）已成为图像分类的事实。但是，这些模型通常需要大量的计算资源。这项研究介绍了视觉变压器（VIT）在比较研究中的应用，以改善伊蚊和库尔克斯幼虫的图像分类。在蚊子幼虫图像数据上对两个VIT模型，Vit-Base和CVT-13以及两个CNN模型进行了RESNET-18和CORVNEXT的培训，并比较确定最有效的模型，以将蚊子幼虫区分为AEDES或CULEX。测试表明，Convnext获得了所有分类指标的最大值，证明了其对蚊子幼虫分类的生存能力。基于这些结果，未来的研究包括通过结合CNN和Transformer架构元素来创建专门为蚊子幼虫分类设计的模型。

translated by 谷歌翻译

Decision making in cancer: Causal questions require causal answers

Wouter A. C. van Amsterdam , Pim A. de Jong , Joost J. C. Verhoeff , Tim Leiner , Rajesh Ranganath

分类：机器学习 | (统计)机器学习

2022-09-15

癌症护理中的治疗决策受到随机对照试验（RCT）的治疗效应估计的指导。 RCT估计在某个人群中，一种治疗与另一种治疗的平均效应。但是，治疗可能对人群中的每个患者都不同样有效。了解针对特定患者和肿瘤特征量身定制的治疗的有效性将实现个性化的治疗决策。通过平均RCT中不同患者亚组的结果来获得量身定制的治疗效果，需要大量的患者在所有相关亚组中具有足够的统计能力，以实现所有可能的治疗。美国癌症联合委员会（AJCC）建议研究人员开发结果预测模型（OPMS），以实现个性化治疗决策。 OPM有时称为风险模型或预后模型，使用患者和肿瘤特征来预测患者的结局，例如总体生存。假设这些预测对于使用“只有在OPM预测患者具有高复发风险的情况下开出化学疗法的规则”之类的规则，对治疗决策有用。 AJCC认识到可靠预测的重要性，发布了OPM的清单，以确保设计OPM设计的患者群体的可靠OPM预测准确性。但是，准确的结果预测并不意味着这些预测会产生良好的治疗决策。从这个角度来看，我们表明OPM依靠固定的治疗政策，这意味着被发现可以准确预测验证研究结果的OPM在用于治疗决策的情况下仍会导致患者伤害。然后，我们提供有关如何开发对个性化治疗决策有用的模型以及如何评估模型是否具有决策价值的指导。

translated by 谷歌翻译

Document Image Binarization in JPEG Compressed Domain using Dual Discriminator Generative Adversarial Networks

Bulla Rajesh , Manav Kamlesh Agrawal , Milan Bhuva , Kisalaya Kishore , Mohammed Javed

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-13

图像二进制技术通常用于增强嘈杂和/或退化的图像来迎合不同文档图像Anlaysis（DIA）应用（如单词斑点，文档检索和OCR）。大多数现有技术都集中在将像素图像馈送到卷积神经网络中以完成文档二进制化，这在使用不完全减压的情况下需要处理的压缩图像时可能不会产生有效的结果。因此，在本研究论文中，通过使用双重鉴别器生成对抗网络（DD-GAN），提出了使用JPEG压缩图像的文档图像二进制的想法。在这里，两个歧视者网络 - 全球和本地工作在不同的图像比率上，并将焦点损失用作发电机损失。提出的模型已通过不同版本的DIBCO数据集进行了彻底的测试，该数据集具有诸如孔，擦除或弄脏的墨水，灰尘和放错地方的挑战。在时间和空间复杂性方面，该模型被证明是高度鲁棒，有效的，并且还导致了JPEG压缩域中的最新性能。

translated by 谷歌翻译

A Multi-Objective approach to the Electric Vehicle Routing Problem

Kousik Rajesh , Eklavya Jain , Prakash Kotecha

分类：神经与进化计算

2022-08-26

电动汽车路线问题（EVRP）引起了研究人员和工业家的极大兴趣，试图从燃油汽车转变为更健康，更高效的电动汽车（EVS）。虽然EVRP似乎与传统的车辆路线问题（VRP）没有太大不同，诸如巡航时间有限，充电时间和电动汽车充电设施的可用性有限的挑战使一切都不同。以前的工作针对物流和交付相关的解决方案，其中均匀的商业电动汽车舰队在进行多次停止后必须返回初始点。在相对的方面，我们解决了个人电动汽车路由问题，并为长期原产地（OD）旅行提供了最佳的单车路线。我们执行多目标优化 - 最大程度地减少了总行程时间和充电累积成本。此外，我们将外部和现实生活中的要素纳入了充电站的交通，到达充电站的弯路距离以及不同充电站的电力成本可变成本。特别是，我们定义了多目标混合整数非线性编程（MINLP）问题，并使用$ \ epsilon $ -constraint算法获得可行的解决方案。我们进一步实施了元热疗法技术，例如遗传算法（GA）和粒子群优化（PSO），以获得最佳的途径，因此是客观值。该实验是针对多个自我生成的数据实例进行的，因此进行了比较。

translated by 谷歌翻译

HTML版本

Survival Mixture Density Networks

Xintian Han , Mark Goldstein , Rajesh Ranganath

分类：机器学习 | (统计)机器学习

2022-08-23

生存分析是事实建模的艺术，在临床治疗决策中起着重要作用。最近，已经提出了由神经ODE建立的连续时间模型进行生存分析。然而，由于神经ODE求解器的计算复杂性很高，神经ODE的训练很慢。在这里，我们提出了一种有效的替代方案，用于柔性连续时间模型，称为生存混合物密度网络（生存MDN）。生存MDN适用于混合密度网络（MDN）的输出的可逆阳性功能。尽管MDN产生灵活的实价分布，但可逆正函数将模型映射到时间域，同时保留可拖动密度。使用四个数据集，我们表明生存MDN的性能优于或类似于一致性的连续和离散时间基准，集成的brier得分和集成的二项式对数可能性。同时，生存MDN的速度也比基于ODE的模型和离散模型中规避的分类问题快。

translated by 谷歌翻译